Correlaciones entre variables del CENSO de Viviendas, Hogares y Personas e Ingresos promedios comunales de la CASEN 2017.

VE-CC-AJ

DataIntelligence

Sabado 10-07-2021

1 Nivel nacional URBANO (código 1)

1.1 Pregunta TIPO_HOGAR:

Esta pregunta posee 7 categorias de respuesta:

1 Hogar unipersonal
2 Hogar nuclear monoparental
3 Hogar nuclear biparental sin hijos 4 Hogar nuclear biparental con hijos
5 Hogar compuesto
6 Hogar extenso
7 Hogar sin núcleo

Leemos las respuestas a la pregunta TIPO_HOGAR del censo de viviendas 2017 y obtenemos la tabla de frecuencias por categoría:

tabla_con_clave <- readRDS("censos/censo_hogares_con_clave_17")
tabla_con_clave_u <- filter(tabla_con_clave, tabla_con_clave$AREA == 1)
b <- tabla_con_clave_u$COMUNA
c <- tabla_con_clave_u$TIPO_HOGAR
cross_tab =  xtabs( ~ unlist(b) + unlist(c))
tabla <- as.data.frame(cross_tab)
d <-tabla[!(tabla$Freq == 0),]
d$anio <- "2017"

# apilamos:

 d_t <- filter(d,d$unlist.c. == 1)
for(i in 2:7){
  d_i <- filter(d,d$unlist.c. == i)
  d_t = merge( x = d_t, y = d_i, by = "unlist.b.", all.x = TRUE)
}
# Agregamos un cero a los códigos comunales de 4 dígitos, que queda en la columna llamada **código**:
codigos <- d_t$unlist.b.
rango <- seq(1:nrow(d_t))
cadena <- paste("0",codigos[rango], sep = "")
cadena <- substr(cadena,(nchar(cadena)[rango])-(4),6)
codigos <- as.data.frame(codigos)
cadena <- as.data.frame(cadena)
comuna_corr <- cbind(d_t,cadena)
comuna_corr <- comuna_corr[,-c(1),drop=FALSE] 
names(comuna_corr)[ncol(comuna_corr)] <- "código"
quitar <- seq(3,(ncol(comuna_corr)-1),3)
comuna_corr <- comuna_corr[,-c(quitar),drop=FALSE]
names(comuna_corr )[2] <- "Hogar unipersonal"
names(comuna_corr )[4] <- "Hogar nuclear monoparental"
names(comuna_corr )[6] <- "Hogar nuclear biparental sin hijos "
names(comuna_corr )[8] <- "Hogar nuclear biparental con hijos"
names(comuna_corr )[10] <- "Hogar compuesto"
names(comuna_corr )[12] <- "Hogar extenso"
names(comuna_corr )[14] <- "Hogar sin núcleo"
quitar <- seq(1,(ncol(comuna_corr)-1),2)
comuna_corr <- comuna_corr[,-c(quitar),drop=FALSE]

1.2 Generación de ingresos promedios a nivel urbano y su unión con la tabla de contingencia

ingresos_expandidos_2017 <- readRDS("Ingresos_expandidos_urbano_17.rds")
df_2017_2 = merge( x = comuna_corr, y = ingresos_expandidos_2017, by = "código", all.x = TRUE)


library(plotly)
fig <- plot_ly(df_2017_2, x = ~`código`, y = ~`Hogar unipersonal`
, name = 'Hogar unipersonal', type = 'scatter', mode = 'lines',
                 width=7000, height=400) 
fig <- fig %>% add_trace(y = ~`Hogar nuclear monoparental`
, name = 'Hogar nuclear monoparental', mode = 'lines+markers',
                 width=7000, height=400) 
fig <- fig %>% layout(autosize = F, width = 800, height = 500)
fig 





1.2.1 Estadísticas a nivel urbano

df_2017_2_sub <- df_2017_2[,-c(1,9,10,11,12,13)]

data_sum <- summary(df_2017_2_sub )

kbl(head(data_sum)) %>%
  kable_styling(bootstrap_options = c("striped", "hover")) %>%
  kable_paper() %>%
  scroll_box(width = "100%", height = "500px")
Hogar unipersonal Hogar nuclear monoparental Hogar nuclear biparental sin hijos Hogar nuclear biparental con hijos Hogar compuesto Hogar extenso Hogar sin núcleo Ingresos_expandidos
Min. : 70.0 Min. : 31.0 Min. : 19 Min. : 56 Min. : 6.0 Min. : 30 Min. : 18.0 Min. :7.054e+08
1st Qu.: 322.5 1st Qu.: 245.5 1st Qu.: 231 1st Qu.: 524 1st Qu.: 38.5 1st Qu.: 327 1st Qu.: 99.0 1st Qu.:2.954e+09
Median : 837.0 Median : 615.0 Median : 545 Median : 1236 Median : 101.0 Median : 842 Median : 258.0 Median :5.697e+09
Mean : 2719.3 Mean : 2039.2 Mean : 1903 Mean : 4445 Mean : 398.7 Mean : 2980 Mean : 1038.8 Mean :1.784e+10
3rd Qu.: 2502.5 3rd Qu.: 2197.0 3rd Qu.: 1821 3rd Qu.: 4748 3rd Qu.: 379.0 3rd Qu.: 3098 3rd Qu.: 858.5 3rd Qu.:1.857e+10
Max. :61429.0 Max. :21508.0 Max. :32189 Max. :60836 Max. :4865.0 Max. :37967 Max. :22623.0 Max. :1.870e+11

1.3 Correlaciones

1.3.1 Kendall

chart.Correlation(df_2017_2_sub, histogram=TRUE, method = c( "kendall"), pch=20)

1.3.2 Pearson

chart.Correlation(df_2017_2_sub, histogram=TRUE, method = c( "pearson"), pch=20)

1.3.3 Spearman

chart.Correlation(df_2017_2_sub, histogram=TRUE, method = c( "spearman"), pch=20)

2 Nivel nacional RURAL (código 2)

2.1 Pregunta TIPO_HOGAR:

Esta pregunta posee 7 categorias de respuesta:

1 Hogar unipersonal
2 Hogar nuclear monoparental
3 Hogar nuclear biparental sin hijos 4 Hogar nuclear biparental con hijos
5 Hogar compuesto
6 Hogar extenso
7 Hogar sin núcleo

Leemos las respuestas a la pregunta TIPO_HOGAR del censo de viviendas 2017 y obtenemos la tabla de frecuencias por categoría:

tabla_con_clave <- readRDS("censos/censo_hogares_con_clave_17")
tabla_con_clave_u <- filter(tabla_con_clave, tabla_con_clave$AREA == 2)
b <- tabla_con_clave_u$COMUNA
c <- tabla_con_clave_u$TIPO_HOGAR
cross_tab =  xtabs( ~ unlist(b) + unlist(c))
tabla <- as.data.frame(cross_tab)
d <-tabla[!(tabla$Freq == 0),]
d$anio <- "2017"

# apilamos:

 d_t <- filter(d,d$unlist.c. == 1)
for(i in 2:7){
  d_i <- filter(d,d$unlist.c. == i)
  d_t = merge( x = d_t, y = d_i, by = "unlist.b.", all.x = TRUE)
}
# Agregamos un cero a los códigos comunales de 4 dígitos, que queda en la columna llamada **código**:
codigos <- d_t$unlist.b.
rango <- seq(1:nrow(d_t))
cadena <- paste("0",codigos[rango], sep = "")
cadena <- substr(cadena,(nchar(cadena)[rango])-(4),6)
codigos <- as.data.frame(codigos)
cadena <- as.data.frame(cadena)
comuna_corr <- cbind(d_t,cadena)
comuna_corr <- comuna_corr[,-c(1),drop=FALSE] 
names(comuna_corr)[ncol(comuna_corr)] <- "código"
quitar <- seq(3,(ncol(comuna_corr)-1),3)
comuna_corr <- comuna_corr[,-c(quitar),drop=FALSE]
names(comuna_corr )[2] <- "Hogar unipersonal"
names(comuna_corr )[4] <- "Hogar nuclear monoparental"
names(comuna_corr )[6] <- "Hogar nuclear biparental sin hijos "
names(comuna_corr )[8] <- "Hogar nuclear biparental con hijos"
names(comuna_corr )[10] <- "Hogar compuesto"
names(comuna_corr )[12] <- "Hogar extenso"
names(comuna_corr )[14] <- "Hogar sin núcleo"
quitar <- seq(1,(ncol(comuna_corr)-1),2)
comuna_corr <- comuna_corr[,-c(quitar),drop=FALSE]

2.2 Integración de ingresos promedios a nivel urbano y su unión con la tabla de contingencia

ingresos_expandidos_2017 <- readRDS("Ingresos_expandidos_urbano_17.rds")
df_2017_2 = merge( x = comuna_corr, y = ingresos_expandidos_2017, by = "código", all.x = TRUE)


library(plotly)
fig <- plot_ly(df_2017_2, x = ~`código`, y = ~`Hogar unipersonal`
, name = 'Hogar unipersonal', type = 'scatter', mode = 'lines',
                 width=7000, height=400) 
fig <- fig %>% add_trace(y = ~`Hogar nuclear monoparental`
, name = 'Hogar nuclear monoparental', mode = 'lines+markers',
                 width=7000, height=400) 
fig <- fig %>% layout(autosize = F, width = 800, height = 500)
fig 





2.2.1 Estadísticas a nivel urbano

df_2017_2_sub <- df_2017_2[,-c(1,9,10,11,12,13)]

data_sum <- summary(df_2017_2_sub )

kbl(head(data_sum)) %>%
  kable_styling(bootstrap_options = c("striped", "hover")) %>%
  kable_paper() %>%
  scroll_box(width = "100%", height = "500px")
Hogar unipersonal Hogar nuclear monoparental Hogar nuclear biparental sin hijos Hogar nuclear biparental con hijos Hogar compuesto Hogar extenso Hogar sin núcleo Ingresos_expandidos
Min. : 2.0 Min. : 1.0 Min. : 1.0 Min. : 5.0 Min. : 1.00 Min. : 1.0 Min. : 2.0 Min. :7.054e+08
1st Qu.: 194.8 1st Qu.: 90.0 1st Qu.: 140.0 1st Qu.: 224.8 1st Qu.: 21.00 1st Qu.: 136.8 1st Qu.: 55.0 1st Qu.:2.853e+09
Median : 358.0 Median : 161.0 Median : 272.0 Median : 491.0 Median : 39.00 Median : 298.0 Median :102.0 Median :5.002e+09
Mean : 429.9 Mean : 212.7 Mean : 344.5 Mean : 655.3 Mean : 49.66 Mean : 387.3 Mean :126.8 Mean :1.371e+10
3rd Qu.: 588.8 3rd Qu.: 285.5 3rd Qu.: 472.0 3rd Qu.: 847.0 3rd Qu.: 63.00 3rd Qu.: 509.2 3rd Qu.:172.5 3rd Qu.:1.141e+10
Max. :2561.0 Max. :1565.0 Max. :2599.0 Max. :5573.0 Max. :374.00 Max. :2997.0 Max. :736.0 Max. :1.870e+11

2.3 Correlaciones

2.3.1 Kendall

chart.Correlation(df_2017_2_sub, histogram=TRUE, method = c( "kendall"), pch=20)

2.3.2 Pearson

chart.Correlation(df_2017_2_sub, histogram=TRUE, method = c( "pearson"), pch=20)

2.3.3 Spearman

chart.Correlation(df_2017_2_sub, histogram=TRUE, method = c( "spearman"), pch=20)